继承自 FoxitPDFSDKPython3._object .
◆ OCRConfig()
| def FoxitPDFSDKPython3.OCRConfig.OCRConfig |
( |
| ) |
|
构造函数。
带参数的构造函数。
- 参数
-
| [in] | is_detect_pictures | 决定是否检测图片。 |
| [in] | is_remove_noise | 决定是否去除PDF图像的噪声。 |
| [in] | is_correct_skew | 决定是否启用偏斜校正。 |
| [in] | is_enable_text_extraction_mode | 决定是否启用文本提取模式。 |
| [in] | is_sequentially_process | 决定OCR引擎是否在一个进程上顺序处理页面。 |
| [in] | is_auto_overwrite_resolution | 决定是否自动覆盖(重写)分辨率。 |
| [in] | resolution_to_overwrite | 要覆盖(重写)的分辨率。 这个参数只有当 is_auto_overwrite_resolution 设置为 false 有效。 |
| [in] | confidence | 用于判断识别文本是否可靠的置信度阈值。值范围从0到100。 |
◆ Set()
| def FoxitPDFSDKPython3.OCRConfig.Set |
( |
|
is_detect_pictures, |
|
|
|
is_remove_noise, |
|
|
|
is_correct_skew, |
|
|
|
is_enable_text_extraction_mode, |
|
|
|
is_sequentially_process, |
|
|
|
is_auto_overwrite_resolution, |
|
|
|
resolution_to_overwrite, |
|
|
|
confidence |
|
) |
| |
设置值。
- 参数
-
| [in] | is_detect_pictures | 决定是否检测图片。 |
| [in] | is_remove_noise | 决定是否去除PDF图像的噪声。 |
| [in] | is_correct_skew | 决定是否启用偏斜校正。 |
| [in] | is_enable_text_extraction_mode | 决定是否启用文本提取模式。 |
| [in] | is_sequentially_process | 决定OCR引擎是否在一个进程上顺序处理页面。 |
| [in] | is_auto_overwrite_resolution | 决定是否自动覆盖(重写)分辨率。 |
| [in] | resolution_to_overwrite | 要覆盖(重写)的分辨率。 这个参数只有当 is_auto_overwrite_resolution 设置为 false 有效。 |
| [in] | confidence | 用于判断识别文本是否可靠的置信度阈值。值范围从0到100。 |
- 返回
- 无返回值。
◆ confidence
| FoxitPDFSDKPython3.OCRConfig.confidence = _fsdk.OCRConfig_confidence |
|
static |
用于判断识别文本是否可靠的置信度阈值。
取值范围为 [0, 100]。数值越大,对识别结果的置信度要求越高。 例如,如果该值设置为 30,则置信度低于 30 的识别文本将被视为不可靠文本,并会被移除。 默认值: 0。
◆ is_auto_overwrite_resolution
| FoxitPDFSDKPython3.OCRConfig.is_auto_overwrite_resolution = _fsdk.OCRConfig_is_auto_overwrite_resolution |
|
static |
决定是否自动设置分辨率。
true 表示 OCR 引擎会自动检测并覆盖图像分辨率。 false 表示通过参数 resolution_to_overwrite 手动设置分辨率。
◆ is_correct_skew
| FoxitPDFSDKPython3.OCRConfig.is_correct_skew = _fsdk.OCRConfig_is_correct_skew |
|
static |
决定是否启用偏斜校正。true 表示启用偏斜校正。 false 表示不启用偏斜校正。 默认值:true。
- 注解
- 偏斜校正只能针对不超过20度的角度进行校正。
◆ is_enable_text_extraction_mode
| FoxitPDFSDKPython3.OCRConfig.is_enable_text_extraction_mode = _fsdk.OCRConfig_is_enable_text_extraction_mode |
|
static |
决定是否启用文本提取模式。
通常,当某些文本部分没有被发现为文本块(如图片上的文本或手写文本)时, 建议将此参数设置为 true。 如果图片的完整文本被正确识别,或者样本包含可能被认为和识别为文本的图像或图案, 建议将此参数设置为 false。 简而言之,此参数使引擎能够识别所有远程接近字母的内容为文本。 true 表示启用文本提取模式,而 false 表示不启用文本提取模式。 默认值:false。
◆ is_sequentially_process
| FoxitPDFSDKPython3.OCRConfig.is_sequentially_process = _fsdk.OCRConfig_is_sequentially_process |
|
static |
决定OCR引擎是否在一个进程上顺序处理页面。
此参数仅在OCR转换中使用。true 表示OCR引擎将在一个进程上顺序处理页面, 转换时间将增加。
false 表示OCR引擎将自动检测进程数。如果只处理一个页面或系统中只有一个处理器, 则使用一个进程。否则,使用并行处理。
默认值:false。
◆ resolution_to_overwrite
| FoxitPDFSDKPython3.OCRConfig.resolution_to_overwrite = _fsdk.OCRConfig_resolution_to_overwrite |
|
static |
用于覆盖 PDF 文档图像分辨率的分辨率值(DPI)。
该参数仅在 is_auto_overwrite_resolution 设置为 false 时有效。 默认值: 300。